A Microsoft apresentou o VALL-E, um modelo de inteligência artificial em desenvolvimento que é capaz de reproduzir qualquer voz humana, criando novas mensagens com as mesmas características vocais.
+ VÍDEO: Passageiros trocam socos em disputa por assento em avião
+ Inteligência artificial vai defender réu em tribunal nos EUA
+ Inteligência artificial vence concurso de arte e causa polêmica
+ Celular velho: veja 5 usos alternativos para o aparelho
Para isso, o VALL-E precisa apenas de um áudio seu de três segundos. A mágica dessa inteligência artificial é que ela “quebra” a sua voz em várias características e as recombina para criar novas mensagens com a sua voz.
Testada com falantes de inglês, a tecnologia foi treinada com mais de 60 mil horas de gravação de mais de 7 mil falantes. Os exemplos de áudios divulgados pela empresa – e que podem ser conferidos aqui – mostram resultados bastante convincentes.
De acordo com a Microsoft, o objetivo final da tecnologia é permitir a criação de ferramentas aperfeiçoadas que transformem textos em áudio, eliminando o problema atual das vozes robotizadas.